ارائه روش هایی برای مسئله ریشه یابی در زبان فارسی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر
  • نویسنده حامد فرزانه فر
  • استاد راهنما محمد رضا احمد زاده
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1389
چکیده

امروزه پیشرفت امکانات نرم افزاری و سخت افزاری، موجب آسانی ذخیره شدن مقادیر زیادی داده شده است. تعداد مستندات متنی روز به روز در حال افزایش است؛ نامه های الکترونیکی، صفحات وب، متون خبری و مقالات تنها بخشی از این گستره رو به افزایش هستند. بنابراین نیاز به تکنیک های متن کاوی همانند روش های خودکار برای رده بندی متون و بازیابی اطلاعات احساس می شود. در مسئله های متن کاوی ریشه یابی کلمات جزء مهم ترین مراحل می باشد. ریشه یابی به معنی تبدیل کلماتی که ریشه ی یکسان دارند به یک ریشه ی واحد است. ریشه یابی به منظور افزایش کارایی در متن کاوی و کاهش فضای خصیصه انجام می شود. تاکنون روش های مختلفی برای ریشه یابی کلمات در زبان های مختلف ارائه شده است. در زبان فارسی نیز در زمینه ی ریشه یابی روش هایی پیشنهاد شده است که هر یک دارای معایب و مزایایی هستند، ولی روشی کلی که در متن کاوی در زبان فارسی از آن استفاده کنند و میزان کارایی بالایی نیز داشته باشد معرفی نشده است. برای بهبود کارایی ریشه یابی در زبان فارسی در این پایان نامه دو روش جدید ارائه شده است. روش اول بر اساس مطالعه ی ساختار ریخت شناسی زبان فارسی پیاده سازی شده است. این روش یک روش ترکیبی است. در این روش جدول جستجو و اتوماتا برای یافتن ریشه مورد استفاده قرار می گیرند. این روش یک روش ایستا بوده و انعطاف پذیری بالایی ندارد به همین دلیل دچار بعضی خطاها در ریشه یابی کلمات می شود. روش دوم نیز مانند روش اول یک روش ترکیبی است. بخش اول این روش مانند روش اول با استفاده از جدول جستجو پیاده سازی شده است. قسمت دوم این روش با استفاده از الگوریتم یادگیری درخت تصمیم گیری پیاده سازی شده است. از آنجایی که روش های یادگیر پویا هستند، بخشی از ضعف های روش اول پوشانده می شوند. در نهایت به منظور مقایسه کارایی از یکی از الگوریتم های ریشه یابی متداول در زبان فارسی استفاده کردیم. همچنین یک پیش پردازش کامل برای متون فارسی پیشنهاد گردید. برای بررسی کارایی از دو روش رده بندی متون با استفاده از چندین الگوریتم معمول رده بندی و روش بازیابی اطلاعات استفاده شد. پس از بررسی نتایج به این نکته رسیدیم که در مقایسه ها روش های پیشنهادی کارایی بسیار خوبی دارند. همچنین مشاهده شد پیش پردازش پیشنهادی تاثیر بسیار بالایی بر کارایی رده بند و سیستم بازیابی اطلاعات دارد.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

مکان یابی در زبان فارسی

امکانات و روش‌های مکان‌یابی یکی از مهم‌ترین مباحث مطرح در حوزۀ زبان‌شناسی شناختی است. زبان با استفاده از منابع و امکاناتی عینی مانند اعضای بدن، اشیاء و موارد موجود در طبیعت و فرایندها به مفهوم‌سازی جهت‌های مکانی می‌پردازد. هر زبان با توجه به مسائل تاریخی و فرهنگی خود، از برخی یا همۀ امکانات فوق استفاده می‌کند. با توجه به این ملاحظات، هدف این مقاله شناسایی امکانات و منابع مکان‌یابی در زبان فارسی...

متن کامل

ارائه یک مدل فازی برای مسئله مکان یابی- مسیریابی در زنجیره تامین مواد غذایی فسادپذیر

امروزه رقابتی شدن بازارها و توسعه مفاهیم مدیریتی، شرکت‌ها را وادار به طراحی و مدیریت بهتر زنجیره‌های تامین کرده است. مدیریت زنجیره تامین بر یکپارچه‌سازی اعضای زنجیره تاکید دارد. زیرا برای افزایش کارایی یک زنجیره تامین نمی‌توان تصمیمات آن را به‌طور جداگانه در نظر گرفته و به بهینه‌سازی آن پرداخت. از آنجایی که نقش بالای عامل مکان‌یابی، مسیریابی در ادامه حیات یک زنجیره تامین پوشیده نیست، لذا یکپارچ...

متن کامل

ارائه مرجعی برای کارکردهای ارتباطی زبان فارسی

تهیه ی مواد آموزشی به روز برای فراگیری زبان فارسی یکی از عمده ترین مسائل مربوط به آموزش زبان فارسی به دیگر زبانان است.در این زمینه استفاده از کارکردهای اجتماعی زبان در شرایط و موقعیت های متفاوت امری لازم است.هدف اصلی این پژوهش ارائه مرجعی برای به کارگیری کارکردها در تدوین مواد آموزشی برای فراگیران زبان فارسی است.دویست دانشجوی فارسی زبان در رشته های کارشناسی مترجمی زبان انگلیسی و کارشناسی ادبیات...

متن کامل

مقایسهء جنبه هایی از ساخت صوتی زبان فارسی و ژاپنی

مقایسهء زبان ها یا زیرنظام های آن ها فرایندی است که حاصل آن می تواند هم به افزایش آگاهی ما دربارهء ساخت زبان ها، شباهت ها وتفاوت های آن ها منجر شود و هم در تحقق اهداف کاربردی در فعالیت های مربوط به حوزهء زبان، به ویژه در ترجمه و آموزش زبان مؤثر واقع شود. وقتی صحبت از مقایسهء دو چیزمی شود، بیشتر پی بردن به شباهت های آن ها مطمح نظر است، اما در مقابله بیشتر پیدا کردن تفاوت هامد نظر است. فرض بنیادی...

متن کامل

حذف گروه فعلی در زبان فارسی: مسئله همانندی و تجویز

این مقاله به تحلیل جملاتی می­پردازد که در زبان فارسی حاوی گزاره مفقود هستند. از بین داده‌های ارائه شده، این بررسی تنها به داده‌هایی نظر دارد که در آن‌ها گزاره محذوف معادل سازه نحوی گروه فعلی (vP) ‌است. در این تحلیل، دو مسئله بافت نحوی (تجویز) و شرایط حذف (همانندی) این سازه‌ها مورد واکاوی قرار می‌گیرد. به‌طور مشخص، با اتخاذ رویکردی کمینه‌گرا، نشان داده‌ می‌شود که تجویز ساختاری حذف گروه ‌فعلی در ...

متن کامل

حذف گروه فعلی در زبان فارسی: مسئله ساختاری

در این مقالة به بررسی و تحلیل ساخت­ بندهایی در زبان فارسی می‌پردازیم که در آنها گروه‌ فعلی (گزاره) محذوف/مفقود است. این بحث، به لحاظ نظری در قالب دو دیدگاه ساختاری و غیرساختاری مطرح می­گردد. با بهره گرفتن از داده­ها و شواهدی از زبان فارسی و با اعمال آزمون­های نحوی مستقل و استانده، به­طور مشخص استدلال خواهد شد که ‌در جایگاه حذف، ساخت نحوی متداول وجود دارد اگر چه در صورت آوایی زبان دارای بازنمون ...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه صنعتی اصفهان - دانشکده برق و کامپیوتر

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023